冷冻电子显微镜(Cryo-EM)已成为结构生物学中基本重要性的工具,帮助我们了解生活的基本构建基础。冷冻EM的算法挑战是共同估计未知的3D姿势和来自数百万个极其嘈杂的2D图像的生物分子的3D电子散射潜力。但是,由于其高度计算和内存成本,现有的重建算法无法轻易地与迅速增长的低温EM数据集尺寸保持同步。我们介绍了Cryoai,这是一种用于均匀构象的从头算重建算法,该构型使用基于直接梯度的粒子姿势优化和来自单粒子冷冻EM数据的电子散射电位。冷冻ai结合了一个学识渊博的编码器,该编码器将每个粒子图像的姿势与基于物理的解码器进行汇总,以将每个粒子图像汇总到散射势体积的隐式表示中。该卷存储在傅立叶域中以提高计算效率,并利用现代坐标网络体系结构来提高内存效率。结合对称损耗函数,该框架可在模拟和实验数据中与最先进的冷冻EM求解器达到质量的结果,对于大型数据集而言,一个数量级的阶数级,并且具有明显低的存储器需求现有方法。
translated by 谷歌翻译
Generative adversarial networks (GANs) are a class of machine-learning models that use adversarial training to generate new samples with the same (potentially very complex) statistics as the training samples. One major form of training failure, known as mode collapse, involves the generator failing to reproduce the full diversity of modes in the target probability distribution. Here, we present an effective model of GAN training, which captures the learning dynamics by replacing the generator neural network with a collection of particles in the output space; particles are coupled by a universal kernel valid for certain wide neural networks and high-dimensional inputs. The generality of our simplified model allows us to study the conditions under which mode collapse occurs. Indeed, experiments which vary the effective kernel of the generator reveal a mode collapse transition, the shape of which can be related to the type of discriminator through the frequency principle. Further, we find that gradient regularizers of intermediate strengths can optimally yield convergence through critical damping of the generator dynamics. Our effective GAN model thus provides an interpretable physical framework for understanding and improving adversarial training.
translated by 谷歌翻译
随着自动化许多具有高保真性的化学任务的前景,化学语言处理模型正在快速迅速出现。在这里,我们提出了一个基于云的实时平台,该平台允许用户实际上筛选感兴趣的分子。为此,将杠杆化从最近提出的大型化学语言模型(名为Moleformer)推断出来的分子嵌入。该平台目前支持三个任务:最近的邻居检索,化学空间可视化和财产预测。根据该平台的功能并获得的结果,我们认为这样的平台可以在自动化化学和化学工程研究中起关键作用,并协助药物发现和材料设计任务。在\ url {www.ibm.biz/molecular_demo}提供我们平台的演示。
translated by 谷歌翻译
深层神经网络目前为显微镜图像细胞分割提供了令人鼓舞的结果,但是它们需要大规模标记的数据库,这是一个昂贵且耗时的过程。在这项工作中,我们通过将自我监督与半监督的学习相结合来放松标签要求。我们提出了基于边缘的地图的预测,以自我监督未标记的图像的训练,该图像与少数标记的图像的监督培训相结合,用于学习分割任务。在我们的实验中,我们在几次显微镜图像细胞分割基准上进行了评估,并表明只有少数注释的图像,例如原始训练集的10%足以让我们的方法与1到10次的完全注释的数据库达到类似的性能。我们的代码和训练有素的模型公开可用
translated by 谷歌翻译
在快速增长的世界中,分散学习算法的设计很重要,在这个世界中,数据分布在有限的本地计算资源和通信的参与者上。在这个方向上,我们提出了一种在线算法最小化从网络上分布的单个数据/模型汇总的非凸损失函数。我们提供算法的理论性能保证,并在现实生活中展示其实用性。
translated by 谷歌翻译
对可解释的AI(XAI)的需求已经很好,但是在监督学习范式之外,几乎没有发表相对较少的发表。本文着重于将解释性和解释性应用于无监督异常检测任务的原则方法。我们认为,解释性主要是一项算法任务,解释性主要是认知任务,并利用认知科学的见解,提出了一种通用方法,用于使用解释异常进行实践诊断。我们定义归因误差,并使用现实世界标记的数据集证明我们基于集成梯度(IG)的方法比替代方法所产生的归因误差明显低。
translated by 谷歌翻译
我们研究基于度量传输的非参数密度估计器的收敛性和相关距离。这些估计量代表了利息的度量,作为传输图下选择的参考分布的推动力,其中地图是通过最大似然目标选择(等效地,将经验性的kullback-leibler损失)或其受惩罚版本选择。我们通过将M估计的技术与基于运输的密度表示的分析性能相结合,为一般惩罚措施估计量的一般类别的措施运输估计器建立了浓度不平等。然后,我们证明了我们的理论对三角形knothe-rosenblatt(kr)在$ d $维单元方面的运输的含义,并表明该估计器的惩罚和未化的版本都达到了Minimax最佳收敛速率,超过了H \ \ \'“较旧的密度类别。具体来说,我们建立了在有限的h \“较旧型球上,未确定的非参数最大似然估计,然后在某些sobolev-penalate的估计器和筛分的小波估计器中建立了最佳速率。
translated by 谷歌翻译
借助大量可用数据,许多企业寻求实施以数据为驱动的规范分析,以帮助他们做出明智的决定。这些规定的政策需要满足操作约束,并主动消除规则冲突,这两者在实践中无处不在。他们也需要简单且可解释,因此可以轻松地验证和实施它们。文献中的现有方法围绕构建规定决策树的变体以生成可解释的政策。但是,现有方法都无法处理约束。在本文中,我们提出了一种可扩展的方法,该方法解决了受限的规定政策生成问题。我们介绍了一种新型的基于路径的混合智能程序(MIP)公式,该计划通过列生成有效地标识了(接近)最佳策略。生成的策略可以表示为多道路拆分树,由于其较短的规则,它比二进制树更容易解释和信息。我们通过对合成数据集和真实数据集进行了广泛的实验来证明我们方法的功效。
translated by 谷歌翻译
物联网(物联网)正在通过弥合信息技术(IT)和运营技术(OT)之间的差距来改变行业。机器正在与连接的传感器集成在一起,并通过智能分析应用程序管理,加速了数字化转型和业务运营。将机器学习(ML)带到工业设备是一个进步,旨在促进IT和OT的融合。但是,在工业物联网(IIOT)中开发ML应用程序提出了各种挑战,包括硬件异质性,ML模型的非标准化表示,设备和ML模型兼容性问题以及慢速应用程序开发。在这一领域的成功部署需要深入了解硬件,算法,软件工具和应用程序。因此,本文介绍了一个名为ML应用程序的名为“语义低代码工程”(SELOC-ML),该框架建立在低代码平台上,以利用语义Web技术来支持IIOT的ML应用程序的快速开发。 SELOC-ML使非专家能够轻松地模拟,发现,重复使用和对接ML模型和设备。可以根据匹配结果自动生成项目代码在硬件上部署。开发人员可以从称为食谱的语义应用模板中受益,从而快速原型最终用户应用程序。与工业ML分类案例研究中的传统方法相比,评估证实了至少三倍的工程努力,显示了SELOC-ML的效率和实用性。我们分享代码并欢迎任何贡献。
translated by 谷歌翻译
我们专注于一个在线2阶段问题,以以下情况进行:考虑一个应分配给大学的系统。在第一轮中,一些学生申请了一些学生,必须计算出第一个(稳定的)匹配$ m_1 $。但是,一些学生可能会决定离开系统(更改计划,去外国大学或不在系统中的某些机构)。然后,在第二轮(在这些删除之后)中,我们将计算第二个(最终)稳定的匹配$ m_2 $。由于不希望更改作业,因此目标是最大程度地减少两个稳定匹配$ m_1 $和$ m_2 $之间的离婚/修改数量。那么,我们应该如何选择$ m_1 $和$ m_2 $?我们表明,有一个{\ it Optival Online}算法可以解决此问题。特别是,由于具有优势属性,我们表明我们可以最佳地计算$ M_1 $,而无需知道会离开系统的学生。我们将结果概括为输入中的其他一些可能的修改(学生,开放位置)。我们还解决了更多阶段的情况,表明在有3个阶段后,就无法实现竞争性(在线)算法。
translated by 谷歌翻译